
當(dāng)前主流AI模型都離不開一種叫作“基于人類反饋的強(qiáng)化學(xué)習(xí)”(RLHF)的訓(xùn)練方式。這種訓(xùn)練方法高度依賴人類反饋,而人類在評價AI回答時,往往傾向于給那些讓自己感覺舒服、被認(rèn)同的回答更高的分?jǐn)?shù)。久而久之,AI大模型就學(xué)會了“察言觀色”“討好人類”的表達(dá)模式,專門挑人類愛聽的話說,而不是堅持客觀真理。目前大多數(shù)人工智能大模型都在借助人類的反饋信號來進(jìn)行優(yōu)化,“匹配用戶立場”、順著用戶說的情況并不能完全避免。 AI大模型對用戶無原則地肯定與贊美看似提供了“情緒價值”,實際上會持續(xù)強(qiáng)化用戶固有想法、放大偏激情緒,甚至誘發(fā)非理性危險行為。專家提醒,心智不成熟的青少年極易受其誤導(dǎo),出現(xiàn)認(rèn)知偏差問題。對于心智尚未健全的青少年兒童接觸人工智能大模型,家長需要格外關(guān)注。 專家支招 如何降低AI大模型“諂媚”風(fēng)險 雖然AI大模型“諂媚”的情況目前不可避免,但還是有一些方法可以將AI“諂媚”的風(fēng)險降低。 人工智能安全技術(shù)從業(yè)人員田天表示:在問大模型問題的時候,應(yīng)該保持中立立場、平和心態(tài)。不要預(yù)設(shè)立場或者預(yù)設(shè)答案,這樣會對大模型有誤導(dǎo)性,反而讓它給不出來正確的答案。 中國科學(xué)院自動化研究所研究員中國科學(xué)院大學(xué)人工智能學(xué)院教授鄭曉龍表示:在使用過程中,如果能夠堅持像做科學(xué)研究一樣,給一個正確的、有理有據(jù)的提示,它產(chǎn)生的諂媚程度也是會減少很多。 專家提醒,與人工智能大模型交互時應(yīng)避免預(yù)設(shè)立場,并做好多方信息核查,將人工智能“諂媚”導(dǎo)致提供錯誤信息的風(fēng)險盡量降低。(來源:央視新聞客戶端)
辟 謠 “浙江一地要熱上50℃”不實
詳情:為確保2026年普通高等學(xué)校招生全國統(tǒng)一考試工作安全順利,全國公安機(jī)關(guān)堅持以最高標(biāo)準(zhǔn)、最嚴(yán)要求、最強(qiáng)措施,嚴(yán)查嚴(yán)打涉考類違法犯罪活動,全力護(hù)航高考安全平穩(wěn)有序。6月8日,公安部網(wǎng)安局公布10起涉高考網(wǎng)絡(luò)謠言典型案例。
案例1:6月7日,廣東省潮州市網(wǎng)民沈某宏為博取關(guān)注、吸粉引流,使用AI工具生成了一張“坐在2026年高考考場并使用手機(jī)拍攝考場”的虛假圖片,并配文“帶都帶了,那發(fā)個抖音吧”后發(fā)布,造成不良社會影響。
案例2:6月7日,河南省駐馬店市網(wǎng)民吳某帥為博取關(guān)注、吸粉引流,使用AI工具生成了一張?zhí)摷俚摹?026年普通高等學(xué)校招生全國統(tǒng)一考試語文試卷”圖片,并在互聯(lián)網(wǎng)平臺發(fā)布,造成不良社會影響。
案例3:6月4日,湖南省郴州市網(wǎng)民李某怡為博取關(guān)注、吸粉引流,在互聯(lián)網(wǎng)平臺編造并發(fā)布了虛假高考答案信息及教唆高考帶手機(jī)舞弊的不當(dāng)內(nèi)容,造成不良社會影響。
案例4:6月4日,湖南省耒陽市網(wǎng)民劉某濤在互聯(lián)網(wǎng)平臺謊稱自己有“高考答案”出售,造成不良社會影響。
案例5:2026年6月6日,湖南省邵陽市網(wǎng)民錢某蘭為博取關(guān)注、吸粉引流,在互聯(lián)網(wǎng)平臺編造并發(fā)布了“高考壓力大,又死人了”的謠言信息,造成不良社會影響。
案例6:6月3日,山東省聊城市網(wǎng)民夏某碩為博取關(guān)注、吸粉引流,在互聯(lián)網(wǎng)平臺發(fā)布信息,謊稱自己“買到2026年高考答案”,造成不良社會影響。
案例7:6月5日,山東省菏澤市網(wǎng)民張某為博取關(guān)注、吸粉引流,在互聯(lián)網(wǎng)平臺發(fā)布所謂“2026年高考答案”的謠言信息,造成不良社會影響。
案例8:6月4日,山東省菏澤市網(wǎng)民張某軒為博取關(guān)注、吸粉引流,在互聯(lián)網(wǎng)平臺發(fā)布信息,謊稱自己有“2026年高考答案”,造成不良社會影響。
案例9:5月21日,廣西壯族自治區(qū)南寧市網(wǎng)民曾某津為博取關(guān)注、吸粉引流,在互聯(lián)網(wǎng)平臺發(fā)布信息,謊稱自己有“2026年高考答案”,造成不良社會影響。
案例10:4月12日,河北省衡水市網(wǎng)民袁某為博取關(guān)注、吸粉引流,通過某短視頻平臺發(fā)布信息,謊稱自己有“高考試題”,造成不良社會影響。
目前,屬地公安機(jī)關(guān)已依法對上述人員作出行政處罰。(來源:“公安部網(wǎng)安局”微信公眾號)
責(zé)編:佘洪濤
來源:中國互聯(lián)網(wǎng)聯(lián)合辟謠平臺
下載APP
分享到